Branch-and-Browse: Exploración web eficiente con razonamiento en árbol
Branch-and-Browse mejora la exploración web con un 35.8% de éxito y reduce el tiempo hasta un 40.4% respecto a métodos actuales. Descubre cómo este framework
Branch-and-Browse mejora la exploración web con un 35.8% de éxito y reduce el tiempo hasta un 40.4% respecto a métodos actuales. Descubre cómo este framework
MyPCBench evalúa agentes de IA como asistentes personales en escritorio Linux con 184 tareas reales. El mejor modelo (Claude Opus) solo resuelve 55.4%.